英伟达自毁CUDA门槛!15行Python写GPU内核,性能匹敌200行C++
英伟达自毁CUDA门槛!15行Python写GPU内核,性能匹敌200行C++GPU编程变天了。
来自主题: AI资讯
6252 点击 2025-12-08 15:16
GPU编程变天了。
几个小时前,NVIDIA CUDA Toolkit 13.1 正式发布,英伟达官方表示:「这是 20 年来最大的一次更新。」CUDA Tile 是 NVIDIA CUDA Toolkit 13.1 最核心的更新。它是一种基于 tile 的编程模型,能够以更高的层次编写算法,并抽象化专用硬件(例如张量核心)的细节。